Python 網絡爬蟲與數據可視化應用實戰

Python 網絡爬蟲與數據可視化應用實戰

作者: 陳允傑
出版社: 中國水利水電
出版在: 2021-11-01
ISBN-13: 9787517090540
ISBN-10: 7517090542
裝訂格式: 平裝
總頁數: 516 頁





內容描述


《Python 網絡爬蟲與數據可視化應用實戰》
是一本介紹大數據時代用 Python 進行數據獲取、數據清洗和數據可視化分析的技術圖書。
全書共分兩篇,
其中第 1 篇主要介紹了數據獲取的相關知識,具體內容包括 HTML、
JSON 與網絡爬蟲基礎,
爬取靜態網頁,使用 CSS 選擇器爬取數據,遍歷 HTML 網頁並獲取數據,使用 XPath 表達式與 Ixml 包創建爬蟲程序,
使用 Selenium 爬取動態網頁,Scrapy 爬蟲框架的使用,數據存儲等 ;
第 2 篇主要介紹數據分析及可視化相關知識,具體內容包括數據可視化基礎知識,
Pandsa 數據處理,使用 Pandas、Matplotlib、Seaborn、Bokeh 等工具進行數據分析和可視化等。
每篇均設置特別章
節進行了綜合案例演練,提高綜合水平。
《Python 網絡爬蟲與數據可視化應用實戰》一書內容豐富,涵蓋面廣,
特別適合作為大中專院校相關專業的教材,也適合作為大數據分析相關專業的自學參考書。


目錄大綱


篇 創建Python爬蟲程序——從網頁獲取數據
CHAPTER 1 HTML、JSON與網絡爬蟲的基礎
1-1 認識HTML
1-1-1 HTML的標籤與屬性
l-l-2 HTML網頁結構
1-2 JSON的基礎
1-2-1 認識JSON
1-2-2 JSON的語法
1-3 網絡爬蟲的概念
1-3-1 認識網絡爬蟲
1-3-2 為什麼需要網絡爬蟲
1-3-3 網絡爬蟲的基本步驟
1-4 網絡爬蟲的相關技術
1-4-1 網絡爬蟲使用的相關技術
1-4-2 使用瀏覽器瀏覽網頁的步驟
1-5 Python網絡爬蟲的相關函數庫
1-6 Spyder集成開發環境的使用
CHAPTER 2 從網絡獲取數據
2-1 認識HTTP頭部與httpbin.org服務
2-1-1 HTTP頭部
2-1-2 用開發者工具查看HTTP頭部信息
2-1-3 認識httpbin.org服務
2-2 使用Requests發送HFTF,請求
2-2-1 發送GET請求
2-2-2 發送POST請求
2-3 獲取HTTP響應內容及頭部信息
2-3-1 獲取HTTP響應內容
2-3-2 內置的響應狀態碼
2-3-3 獲取響應的HTTP頭部信息
2-4 發送進階的HTTP請求
2-4-1 訪問Cookie的HTTP請求
2-4-2 創建自定義HTTP頭部的HTTP請求
2-4-3 發送RESTful API的HTTP請求
2-4-4 發送需要認證的HTTP請求
2-4-5 使用timeout參數 請求時間
2-5 錯誤/異常處理與文件訪問
2-5-1 Requests的異常處理
2-5-2 Python文件訪問
CHAPTER 3 爬取靜態HTML網頁數據
3-1 在HTML網頁定位數據
3-1-1 網絡爬蟲的數據爬取工作
3-1-2 如何定位網頁數據
3-2 使用BeautifulSoup解析HTML網頁
3-2-1 創建BeautifulSoup對象
3-2-2 輸出解析的HTML網頁
3-2-3 BeautifulSoup的對像說明
……
第二篇 Python數據可視化——大數據分析


作者介紹


陳允傑
中國台灣地區著名信息技術作家,已出版多本人工智能、
機器學習/深度學習、數據科學、網絡爬蟲、大數據分析和物聯網相關圖書。
另外,他開發了多種幫助初學者學習程序設計的教學工具,
如fChart流程圖解釋器(可執行的流程圖),支持Python、
JavaScript和C語言的Blockly可視化積木程序編輯器,
並且將相關教學工具導入大專和中高職的圖書和程序設計教學中。




相關書籍

網絡爬蟲進化論 — 從 Excel 爬蟲到 Python 爬蟲

作者 曹鑑華

2021-11-01

自動駕駛

作者 張宏亮 徐利民 曾文達

2021-11-01

Applied Numerical Analysis Using MATLAB, 2/e (Hardcover)

作者 Laurene v. Fausett

2021-11-01